home *** CD-ROM | disk | FTP | other *** search
/ Skunkware 5 / Skunkware 5.iso / src / Tools / glimpsehttp / README < prev   
Text File  |  1995-05-16  |  5KB  |  107 lines

  1. NAME
  2.   GlimpseHTTP
  3.  
  4. WHAT IS GLIMPSE
  5.   Glimpse (which stands for GLobal IMPlicit SEarch) is an indexing and
  6.   query system that allows you to search through lots of files in many
  7.   (possibly nested) directories very quickly.
  8.   Glimpseindex, which you run by saying glimpseindex <directory(ies)>
  9.   builds a very small index (2-5% of the text).
  10.   With it, glimpse can search through all the files in these directories
  11.   much the same way as grep, except that you don't have to specify file 
  12.   names.  Glimpse supports most of agrep's options (agrep is our
  13.   powerful version of grep, and it is part of glimpse) including
  14.   approximate matching (e.g., finding misspelled words), Boolean queries,
  15.   and even some limited forms of regular expressions.
  16.  
  17. DESCRIPTION
  18.   GlimpseHTTP is a collection of tools that allows you to incorporate
  19.   glimpse in WWW documents.  With it, you can provide general
  20.   search capabilities to any user without incurring too much space 
  21.   overhead.  Furthermore, these tools allow you to integrate search with 
  22.   browsing.  If you have several nested directories which the user may
  23.   browse, you can include the glimpse interface in each document such that
  24.   only the relevant directories will be included in the search.  More
  25.   details are given below.
  26.   The current version of GlimpseHTTP was
  27.   tested under httpd 1.2 HTML server from NCSA and
  28.   Glimpse currently works on many Unix platforms.
  29.   To search and browse the information any HTML browser can be used
  30.   (this includes NCSA Mosaic for X-Windows, MS-Windows and
  31.   Macintosh, Lynx and other browsers. For maximum convenience
  32.   your browser should support forms, although minimal
  33.   functionality can be achieved with any browser).
  34.  
  35.   Since GlimpseHTTP uses Glimpse, this provides some unique features
  36.  
  37.   - A very small index (3-5% of the total text).
  38.   - Reasonably fast search.
  39.   - Search for approximate match allowing errors.
  40.  
  41.   In addition, GlimpseHTTP provides you with the following
  42.   capabilities:
  43.  
  44.   - You can use a combination of browsing and searching:
  45.     first, you locate the directory where the relevant
  46.     information can be stored, then you can use search
  47.     to locate specific files.
  48.   - The result of the search is a nicely formatted hypertext with
  49.     hyperlinks to matching documents.
  50.   - Following the hyperlink leads you not only to a particular
  51.     file, but also to the exact place where the match occured.
  52.   - Hyperlinks in the documents are converted on the fly to
  53.     actual hyperlinks, which you can follow immediately. This
  54.     makes the GlimpseHTTP particularily suitable for searching
  55.     meta-information (Internet directories etc.).
  56.   - Similar tools are provided for archiving and searching
  57.     USENET newsgroups. You can maintain the archive of news articles
  58.     and allow people to search your archive using the
  59.     same interface. Features supported include kill-file for articles
  60.     and fast search for particular posters. Since news archiver uses
  61.     NNTP interface, you can archive news articles from remote
  62.     news servers. (Browse and search for news is yet to be
  63.     implemented: browsing in this case means selection of pertinent
  64.     newsgroup(s), currently supported is only the search within
  65.     one newsgroup a time)
  66.  
  67.   Among the possible applications of GlimpseHTTP we envision:
  68.  
  69.   - FTP sites with search possibilities;
  70.   - news archiving sites;
  71.   - any search application which should be accessed over local
  72.     or global network where searching for approximate match and/or
  73.     saving of disk space for indices is an issue.
  74.  
  75. GlimpseHTTP components:
  76.  
  77.   1. aglimpse - "Archive Glimpse" - a tool for searching file
  78.      hierarchies indexed for Glimpse. aglimpse is a CGI-compliant
  79.      program which performs the search and formats the output as 
  80.      HTML document with hyperlinks to the matches.
  81.  
  82.   2. Administrative tools which facilitate maintaining and
  83.      indexing of Glimpse archives. One of the programs is the
  84.      HTML indexer which prepares hypertext indices for
  85.      each searchable directory - this supports the concept
  86.      of combined browsing and searching.
  87.  
  88.   3. GlimpseNews - a collection of tools for archiving and
  89.      searching newsgroups archives.
  90.  
  91. SEE ALSO
  92.     http://glimpse.cs.arizona.edu:1994/glimpsehttp.html -
  93.         GlimpseHTTP home page.
  94.     http://glimpse.cs.arizona.edu:1994 - Glimpse
  95.         developers home page.
  96.     README.install - directions on installing GlimpseHTTP
  97.         on your server.
  98.     README.amgr - description of Archive Manager.
  99.     README.indexing - descriptioN of HTML indexer.
  100.  
  101. AUTHORS
  102.         Paul Klark (GlimpseHTTP)
  103.         Udi Manber, Sun Wu, and Burra Gopal (Glimpse)
  104.         University of Arizona, Department of Computer Science
  105.     To be put on glimpse mailing list, send mail to
  106.     glimpse-request@cs.arizona.edu
  107.